03A:第3回 情報検索
★偶数組は対面,奇数組はオンライン★
オンライン組はTeams授業会議に参加
【目次と関連記事】
◆0.はじめに
◆1.( 再確認 )龍大Gmailでの課題提出について
◆2.情報検索入門
◆3.タイピング(3)
◆0.はじめに
◎出席: 今日のrespon:13:20開始,締切は15時
※受付開始を,授業開始10分前に変更しました
https://gyazo.com/e9c0211c1ee1df69f40909576f8beee5
1. 「教室番号/参加場所」
2. キーワード:授業の冒頭に口頭で伝える
3. 前回の内容の自己評価
★予告:最終レポート★
第6回に「最終レポート課題」を提示します.以下に予告を示します.
最終レポートは毎回の学習内容を盛り込んだ課題です.必要な事項を把握しておきましょう.
★質問をしよう★
対面でもオンラインでも,質問はしにくいものです.でも, ここは練習の場です.「こんなこと聞いたら叱られる」など考える必要はありません.ただし,なんでもかんでも頭から聞くのはお勧めできません.学習の手順としては
まず自力で調べてみる,考えてみるステップを踏むのが大切です.
具体的には,(1)まず本実習教材と関連記事を読み,さらに(2)ネットで調べることです.
これでもわからなければ,遠慮せずどうぞ.単純な質問でもスタッフはお答えします( 少なくともヒントは出します ).
わからないまま放置して前に進めますか?今聞かないでいつ聞きますか?
という事で,主にオンラインでの質問についてまとめたので参考にしてください.
対面受講の人もぜひ質問チャネルに書き込みをしてください.口だけでなく文字にして質問することは「今生じている問題を整理して(なるべく正確に)他人に伝える」という,知的生産にとって大切な手続きの一つです.この実習が練習だと思って,積極的に書き込みましょう.
★今回の内容★
第1回・第2回と,メールを設定し,オフィススイートをインストールして,環境を整えてきました.
今回は情報検索について学びます.
ただしその前に,まだメールでの課題提出が正しくできていない人がいるので,もう一度確認します.
★その他注意事項★
1.前回も言いましたが,実習時間中に訂正や追加などで,コンテンツが更新されることがあります. 担当教員が 「内容を書き換えた」と言ったら, ウェブブラウザを「リロード (reload) 」( 更新,再読込 ) してください.
2.manabaやTeams,Gmailの使い方について,詳細を解説することはしません.
※実習中にTAや教員に質問するのはOKです.
3.自PCをしっかり充電しておきましょう.今どきのPCなら満充電で10時間はもつはずです.前の晩に充電しておくのを忘れずに.
もしバッテリー切れになった場合は次のような方法が考えられます.
a. 1-542のディスプレイ:あなたのPCがUSB Type-C PDに対応していれば,大学PCのディスプレイのType-Cケーブルに接続すれば充電可能.急速充電は期待できない
b. 図書館,1号館廊下などACコンセント利用可能な場所があるのでそこに移動して参加
※対面の場合は必ず教員に申し出て下さい.勝手に移動すれば欠席扱いになります.
※補足※教室でも計算機室でも,自由に充電はできません( ディスプレイ接続は裏技 ).今後,他の授業でも利用する事を考えると,PCに見合った容量のモバイルバッテリーを持っておくことを強く推奨します.十分な容量のモバイルバッテリーであれば,大学にいる間はACアダプタは不要でしょう.
では始めていきましょう.
◆1.( 再確認 )龍大Gmailでの課題提出について
龍大Gmailでの課題提出を受け付けているが,いろいろと間違えている人がいる. すでに提示した記事を各自よく確認した上で今後のメールを送信すること.
なお,すでに提出したメールは,以下の問題点に気づいたとしても,再送信( 再提出 )はしないこと.
https://gyazo.com/9d7a92404f66d0605c360082da807590
※例外: 下記( 1 )に違反した場合のみ, 龍大アカウントを使っての再送信を認める.
◆前準備:実習用ディレクトリを作る
実習が進んできたので,各自の「ドキュメント」フォルダの下に,本実習用ディレクトリを作り,以降の作業はここに保存する.
※「ディレクトリ」とはWindows/MacOSでは「フォルダ」と呼ぶものと同義である.本実習に続く計算機実習IではUnixを学ぶので,本実習でもディレクトリと呼ぶことにする.
場所:自PC「ユーザ」>「ドキュメント」フォルダ下
ディレクトリ名:情報基礎 ← 原則,この名前にするが変えても構わない
※これを以降「実習ディレクトリ」と呼ぶ.
実習中に作成するファイルおよび,レポート用に作成する各種ファイルもここに保存する.
◆2.情報検索入門
皆さんはすでに,普段スマホでいろいろな検索をしていると思う.検索についてはある程度理解している,と感じているだろう.しかし,第2回課題では自PCの情報を調べた際に,すんなり目的の情報を得られただろうか?
一口に検索と言っても単純なものもあれば,容易には検索困難なものもある.ある程度わかっていたとしても情報の検索には「慣れとコツ」,さらには検索の仕組みについての知識が必要である.
以下に大きく5つの検索例を紹介するので,実際に操作しながら確認していこう.すでにわかっている,知っていることでもスルーせずに確認すること.
検索した結果は,テキストにまとめて,適当な名称のファイルに記録して,保存しておきなさい.
「メモ帳」やGoogleKeepなどのメモアプリを使い, 「検索結果メモ」というファイル名で保存する.
※このファイルは提出しなくてよい.
記録するべき事項についての指示📝があるが,それ以外でも気付いた点はメモすること.
検索する工夫やテクニックについては,以下にまとめたので一読しておこう.
( 1 ) 検索語を入力すればすぐに見つかる場合
( 1a ) 文部科学大臣の名前
「日本の文部科学大臣の名前は?」のような課題であれば, 「文部科学大臣」という検索語で,すぐに文部科学省のサイトが見つかる. このサイト内を探せば現在の文部科学大臣の名前を見つけることができる. 実際に調べてみよう.
📝検索語,参照URL,検索結果をメモ
簡単に検索結果が得られる場合でも,次の2点には特に注意する必要がある.
最新の( 現在の )情報かどうか ← 過去の大臣名が出てくることも
公式な( 直接的な )情報かどうか ← 誰かが書いた適当な記事かも
ただ検索しただけの結果は「正しいもの順」「新しい順」ではないことに注意.
やればわかるが,検索結果にはまず広告が上にくる.殆どの検索サイトは広告収入で運営されているからだ.
つぎに「SEO」という検索最適化技術によるサイトが上にくる.
つまり上に来る記事は多くの人に読まれて信頼ができる記事ではなく, 広告と検索最適化技術の結果として上位をゲットしている記事である.
検索上位のリンク ≠ {信頼/正確/公式/最新} を理解しておく必要がある.
( 1b ) 京都発東京行きの新幹線の始発時刻
公式な( 直接的な )サイトを選択するにはどうすればいいか.
→ それにはより人間的な知能が必要.
たとえば,「京都発東京行きの新幹線のぞみの始発の時刻は?」を調べよう.
「新幹線 のぞみ 時刻表」という検索語を使うと,複数の時刻表サイトが表示される. 「公的な・直接的な」という観点からだとJRが運営する「JRおでかけネット」を選択するのが妥当であろう.
※現実的には「Yahoo乗換案内」「ジョルダン」なども十分信頼できるが,「公式」と言えるのはJRの直営サイトしかない.
公式サイトがわかっている場合,検索語を工夫すればよい.
( 「JRおでかけ 新幹線 のぞみ 時刻表」など )
実際に検索して,始発時刻を調べてみよう.
★★実習★★ 明日の朝の出発を想定して上の時刻を調べよう.
📝検索語,参照URL,検索結果をメモ
( 1c ) 公式か非公式か
厳密には何が公式かを判別するのが難しいジャンルや,公式サイトが他国語である場合( 海外政府の公式サイトや国際学会のサイト等 )がある.これはしっかり人間が考えて判断する必要がある.以下に例を挙げる.
a.仮想通貨:ビットコインなどの仮想通貨は公式サイトに似せて作られている多くの非公式サイトが存在する
b.ソフトウェア:いわゆるダウンロードサイトは公式以外にも沢山ある.特に無料のソフトウェアやオープンソースのソフトウェアは公式サイトではないサイトに飛ばされることがある
c.セレブリティ:有名人やアーティストの公式サイトは、ファンサイトやニュースサイト、ブログなどに埋もれて見つけにくい.本人のSNSアカウント,事務所のサイトなど,「公式」が複数あることも
d.ブランド製品:高級ブランド商品や人気ブランド商品は取り扱い販売店が多く,また偽物を売る非公式サイトが多く存在する
e.NGO/NPO:非営利団体や非政府組織の公式サイトは支援者が作成したサイトや関連ニュースサイトに埋もれて見つけにくい
f.外国の行政機関:日本語で表示されないサイトが多い.日本語の検索結果ばかり追いかけていてはたどり着けない
一概には言えないが,このような場合は信用できる関連サイトからの参照リンクたどるのが比較的安全.海外政府のサイトだと,日本国の外務省サイト でその国や政府の情報を調べることができる.信頼性も高い. 「公式」に準するものとして,インターネット上のフリーの百科事典である ウィキペディア( Wikipedia )を利用するという方法もある.WikiPediaがなぜ「公式」に近いのかといえば,以下のような理由による. 1. 専門的な知識を持った複数の人間が記述している
2. 間違いや情報不足を指摘し合う仕組みがある
3. そのやりとりも公開されている
4. 結果としてより正確な記述になるように編集を重ねる仕組みができている
ただし,WikiPediaはあくまでもボランティアサイトであり,すべての知識・情報がここにあるわけではないし,ここに書かれている情報がすべて正しいという保証はない.更新は保証されておらず最新の情報には弱い.しっかりした確証を得るには,他のサイトを併用して検証すべきである.
★★実習★★公式サイトを探す
1.ミャンマーの国の概要情報を知りたい.
まず,WikiPediaで「ミャンマー」で検索する.
次に一般検索サイト( GoogleやBing )でも検索し,WikiPediaの情報と比較する.
ミャンマーの国公式サイトのURLも確認しておく.
📝得られた情報の比較をメモ
2.「シュープリームXナイキコラボ」の靴を探したい.
ナイキ公式サイトとSupreme公式サイトの商品欄はどこにあるのか.
最終的に公式サイトでの商品名称とその定価( 販売希望価格 )を調べよう.
※これは人気の限定商品で,公式情報は一発ではでてこないケース.方法はいろいろだが,信頼のできそうなショップ( 特に専門店 )から参照リンクをたどってみよう
※Supreme( ← Wikipedia )とはスノボーショップ発信のファッションブランド 📝たどったサイトと得られた結果をメモ
( 2 ) 検索の前に下準備が必要な場合
検索語が不適切だと正しい結果が得られないことがある.
( 2a) イタリア料理以外のレストラン
イタリア料理以外のレストランを京都駅近辺で探したい.が,「イタリア料理 京都駅」と検索しても,「イタリア料理以外 京都駅じゃない」などとしてもその結果はほぼ同じで, 京都駅周辺のイタリア料理店が示される.イタリア料理以外の店は見つかりにくい.
★★実習★★この場合はどうすればいいかを調べなさい.
◎ヒント◎ "-イタリア料理" などの論理オプションを使う,などが考えられる.
📝検索の工夫をメモ
( 2b ) 読めない漢字の読み方
音読みも訓読みも知らない時はどうすればよいだろう.
一文字ずつの読みがわからない.
この場合は2段階で調べる.
1. まず「漢和辞典サイト」に行き,部首,画数などを入力し,上の文字を見つけてメモ帳などコピーする.
2. そのあと「国語辞典サイト」で調べる
★★実習★★実際に読みを調べる
漢和辞典サイトでhttps://gyazo.com/cdac865a743c0955de727cc3c46ed2caの読みを調べなさい.
参照URL,読み方についてメモすること.
上のがわかったら,https://gyazo.com/9b2746bc4c4070aa507b5107ed12b8a4はどう読むか?
← 漢字も似ているが本体も似ている.
※じつは上の文字と同じ読みもある.
📝検索の手順と結果をメモ
( 3 ) 英語で検索する必要がある場合
インターネットで調べる時,我々はまず日本語のコンテンツを調べる.しかし情報量でいえば,当然ながら英語での情報が圧倒的に多い.世界には英語でしか得られない情報がたくさんある.以下はWikipediaの記事数.
英語版 6,809,127項目 (2024年4月, 世界1位)
日本語版 1,411,002項目(2024年4月, 世界13位)
たとえば「リベリアのサッカー女子ナショナルチーム監督のプロフィールは?」という場合( リベリアはアフリカの国 ),ウィキペディア日本語版だと監督の名前まではわかるが,プロフィールまではたどり着けない.
これには下準備として,次のような調査が必要である.
1. "リベリア""サッカー""監督"の英語スペル ←辞書サイトで
2. サッカーの国際組織は何か
3. リベリアのサッカー組織は何か
得られた英語を組み合わせて検索すれば,それらしい情報が得られる.
あるいはサッカーの組織サイトを開き,そこで内部検索してもよい.
英語が分からなければGoogle翻訳なり辞書サイトで調べればよい. 実際にリベリアの監督名を調べてみよう.
★★実習★★サッカーリベリア女子代表チーム監督のプロフィール
検索語は英単語で.信頼できる英語の公式サイトまたは準公式サイト( Wikipedia等 )を選ぶ.
検索語( 英語 ),参照URL( 英語サイト ),検索結果( 英語 )について記載すること.
※リベリア女子サッカーチームの近年の活動情報は非常に少ないので頑張ってほしい.
📝検索の手順と結果をメモ
( 4 ) 検索結果の分析・整理が必要な場合
大学や一般社会の課題では, 単に検索結果を報告すれば済むようなものとは限らないことが多い.
たとえば,いわゆる「ら抜き言葉」の問題として 「なぜ「着れる」はダメで「切れる」はOKなのか?」 ということを調べなければならないとしたら,どう対処すればいいだろうか.
まずは, 「ら抜き言葉とは何か? なぜ良くないとされるのか?」 について調べることから始めなければならない.
ただし,こういう知識についてはいわゆる「公式サイト」はなく, 検索結果のサイトに書かれていることが本当に正しいかどうかの判断はつけにくい.
そもそも,専門用語が多く使われると内容を理解するのも難しいかもしれない.
こうした場合はそのジャンルの基礎知識をはじめとして,一つひとつを分析・整理していく地道な作業が必要となる.
※ヒント:言語の専門家はだれかを考えてみよう.言葉をつかう業界.学会は?
( 4a ) ら抜き言葉
* ★★実習★★ ら抜き言葉とは何か,なぜ良くないとされるかについて調べなさい.
📝検索語,参照URL( 複数可 ),調査結果( 要約すること )についてメモ
( 4b ) 「着れる」と「切れる」
★★実習★★ なぜ「着れる」はダメで「切れる」はOKなのかを調べる.
検索して直接答えが見つからなかったら,( 4a )の結果を踏まえて考察しよう
📝検索語,参照URL,調査結果の要約をメモ
※補足※こういう複雑な検索は生成AIが得意とするところだ.が,時々嘘を付く.これについては次回で学ぶ.
( 5 ) 言葉で検索できない場合
言葉から画像や音楽を検索することは比較的やさしい.
たとえば「モナリザの画像」と入力し検索すると モナリザの絵はすぐに見つかる.
しかし一般的にその逆,つまり, 画像や音楽からそれが何であるかを調べ ることは, インターネット上では容易でない. 絵を眺めて「これはフェルメールの絵ではないか?」と見当がつく場合は 単語検索可能だが, まったく見当の付かない場合は適当な方法がない.
ただ解決法がないわけではない.Googleには画像検索( Google Lens )が用意されている.
Googleの検索画面右上の「画像」ボタンをクリック.
https://gyazo.com/0547fb685e22882a9ccf0d30a19ff7c0
検索欄にGoogleLensマークが出るのでこれをクリック.
https://gyazo.com/4e82910ee9f89951c9493b600e2ffe9a
「ファイルをアップロード」で,探したい元の画像をアップロードすれば,似た画像を検索できる.
https://gyazo.com/006aab47e301f686303268771a1205ea
※実際にいくつかやってみればわかるが,検索結果は強く画像に依存する.すごく近いものまたは同じ画像そのものがヒットすることもあれば,全然違うものが候補に上がる事がわかるだろう
※画像検索は元の画像に特徴がよほどはっきりでていない限り,クリーンヒットは難しい
★★実習★★ 実際に何かの画像を使って検索してみなさい.
📝使った画像,検索結果について📝
☆コラム☆:検索技術について☆
WWWがインタネットに登場して以来,マルチメディアデータの検索技術は日々研究され進歩している.
「暗い部屋でこちらを見ている少女」「椰子が生えた夏の海辺」といった「あいまい検索」
「静かな落ち着いた音楽」「悲しい表情の人物画」といった「感性情報検索」
ハミングをキーにして楽曲を検索する「鼻歌検索」
ユーザの属性,つまり仕事内容や好み,思考のクセといったものを検索履歴からデータ化して蓄積し, それを参考にして次の検索に反映させる自己学習型検索機能
探したい画像をアップロードして検索する「画像マッチング検索」
など,従来,特定の決まった言葉でしか探し出せなかったものが, 人間の発想や自然な言葉を柔軟に受け付けられるように変化している.
その究極系が生成AIだと言えよう.これについては次回紹介する.
◆3.タイピング(3)
まだまだタイピング練習をする.
まだ手元を見てしまう人は必ずハンカチやタオルをかけること.
★★実習★★ タイピング(3)
この回は「ローマ字入力で日本語かなを打つ」だ.
★おすすめ教材:
流れてくる寿司を食べて(?)いくゲーム
目標:80打/分
※ちなみに藤井は:211打/分,3.2打/秒 ← ローマ字は苦手です( 普段はかな入力なので )……
※ローマ字かなの表記は複数あるものがあり,サイトによって違うことがあるので注意.
例:「ふ」= fu / hu,「ちゅ」= chu / tyu など
提出期限は次回開始まで.
以上.
2024/4/16
短期記憶しか持たない数学者と家政婦親子とのふれあい.